JMP Pro是专为科学家和工程师打造的预测分析软件,是
JMP统计发现软件的专业版,除拥有
JMP的所有功能外,还提供一些可以让用户从容应对复杂分析工作的高级功能,包括预测建模和交叉验证技术,能让统计发现工作提升至全新的水平。用户能够充分利用台式巨型机的强大功能和处理速度,通过简单易用的界面挖掘和理解数据。
软件
适合人员
几乎所有行业的分析师、工程师、统计学家、
数据科学家、建模人员和数据挖掘人员。
构建更佳的模型
任何人都能对上一年的业绩进行出色的整理和说明。但是,没有适合的预测分析工具,就会大大增加通过建模预测新客户、新流程或新风险的难度。JMP Pro提供一系列丰富的算法,让用户能够利用现有数据构建高效的模型。
改善预测模型
利用各类数据增强预测模型的功效,其中包括所收集的
非结构化文本数据,如修复日志、工程报表和客户调查反馈等。可以通过JMP Pro对数据加以组织,将其转化为实用的预测模型辅助信息,从而做出更自信的决策。
构建管理模型
操作模型并不是一件苦差事 – JMP Pro让用户能够在处理多个模型的同时管理工作。可以对模型进行存储、刻画、对比,并通过生成代码将其添加至SAS等其他系统中。
统计工具
JMP Pro提供一系列极为实用的
统计工具,并辅以参与JMP开发工作的数学家和统计学家的支持。用户既不需要在功能中进行茫然的选择,也无需编程,即可进行数据分析工作。此外,通过动态链接的数据、统计和图形数据,JMP Pro能够通过三维图形或动画生动呈现调查结果,从而生成极具价值的新见解以简化您的说明。
预测建模和验证
预测建模和交叉验证
JMP Pro中包含一系列丰富的算法,可利用现有数据构建高效的模型。要进行预测建模,最实用的一些技术是
决策树、Bootstrap森林法、
朴素贝叶斯和神经网络。
JMP Pro的“分割”平台采用先进的方法自动执行树构建进程。此平台也适用于K最近邻(K-NN)模型。
“自助法森林”采用随机森林技术,能够利用数据的随机子集生成众多决策树,并计算这些决策树中每个因子所造成影响的平均值。提升决策树技术可以构建很多简单树,从而将一棵树的残差变异重复拟合至另一棵树。
“朴素贝叶斯”平台采用Bayes定理原则,可用于预测分类响应。此平台甚至允许预测数据中未显示的预测变量的组合。
借助高级“神经”平台,用户可以利用所选的三种激活函数构建一层或两层神经网络,此外,该平台还提供采用梯度提升功能的自动模型结构。此平台能够自动处理缺失值和连续X变换,可达到事半功倍的效果,并且包括可靠的拟合选项。
JMP Pro的所有平台均采用交叉验证方法,既能实现模型验证,又能将未来数据全面纳入其中。为了更有效的进行预测建模,用户需要用有效的方法进行模型的验证,而复杂的模型很容易导致过拟合。因此对于大型的复杂模型,我们总是需要进行交叉验证。JMP Pro提供“数据划分”或“保留”选项来执行该操作。交叉验证技术能够帮助您构建更好的模型,从而使得未来数据 - 关于新客户、新流程或者新的风险 - 也可以在这些模型上得到很好的应用,从而帮助您做出由数据驱动的未来决策。
一直以来,我们都通过将数据集划分为训练集、测试集和验证集来避免过度拟合,以确保构建的模型不仅仅依赖于用来建模的样本数据。JMP Pro一般会通过使用“验证列”来实现交叉验证。无论要达到何种目的,您都可以通过设置“验证列”将原始数据划分成不同的数据集(可采用随机抽样或分层随机抽样)。
训练集用于构建模型,验证集用于帮助用户在建模过程中针对模型的复杂程度做出选择,而完全不参与建模过程的测试集,主要用于评估不同建模方法的好坏。对于数据量比较小的数据集,还会提供K重交叉验证。此过程可帮助您构建有效推广至新数据的模型。
需要注意的是,观测数据的作用也仅限于此。要真正了解因果关系,多数情况下您可能需要采用实验设计(
DOE)。JMP为用户提供使用简便、世界领先的最优DOE工具。
模型比较
在实际应用中,某些模型在一些特定的情况下拟合性较好,但在其他情况下则较差。JMP Pro提供多种
拟合方法,我们需要找出在特定的情况下哪种方法的拟合效果最好。一般构建模型的典型思路是尝试多种不同的模型:或简单或复杂,包含或不-包含特定的因子/预测变量,采用不同的建模方法,甚至是多个模型的平均(组合模型)。
所有的这些模型都有相同的拟合指标用来判定模型的好坏:R2、误分类率、
ROC曲线、AUC、提升曲线等等。
使用JMP Pro的模型比较,用户可以对不同拟合模型生成的所有预测列进行比较,并选取拟合优度、简约性、交叉验证性组合最佳的模型。JMP Pro会自动给出最佳的结果。同时,还可以借助模型刻画器动态交互地查看每个模型选取的关键因子有哪些。借助JMP Pro的模型比较功能,用户可以方便地对多个模型同时进行比较,还能根据需要进行模型平均。
模型库和生成代码
模型库和生成评分代码
当构建多个模型时,用户的数据表将不再因包含执行模型比较所需的大量额外预测公式列而负担过重。可将评分代码保存至“公式库”并应用至新数据。结果为中央建模中心,让用户可轻松访问您的模型并部署至其他系统。
连接丰富资源
连接SAS®的丰富资源
作为SAS预测分析和数据挖掘解决方案之一,JMP Pro能够轻松与SAS进行连接,扩展其分析功能,依托并借助强大的SAS分析与数据集成能力。无论是否与SAS相连接,JMP Pro均可输出SAS代码,使用新数据对JMP构建的模型进行快速、轻松的评分。
新型建模
广义回归是站在模型改进的角度而提出的一系列新的建模方法。该方法通过正则化即引入惩罚项进行回归来进行模型的拟合与估计。
当预测变量之间存在强相关或者预测变量数大于观测个数时,标准的回归方法基本是行不通的。而预测变量之间存在
多重共线性(实际情况常常如此),逐步回归法或者其他标准的回归方法也得不到令人满意的结果。这些模型往往会出现过拟合,在新数据的应用上表现很差。但是在建模之前如何确定该剔除哪些变量--或者更糟的情况是,你要花费多少时间来手动筛选变量用以构建最终的模型
拟合模型中的“广义回归”在进行回归时,基本会包含所有的变量和信息。广义回归过程是一个完整的建模架构搭建过程,它可以帮助用户进行变量选择、模型诊断,再到LS均值比较、逆预测乃至整个模型刻画。这都是JMP Pro所特有的功能。
最后需要指出的是,广义分布还为响应变量提供了多种分布选项,因此当响应变量为计数数据、含有大量离群点的数据或偏态数据时,都能够进行很好的模型拟合。与JMP Pro中的所有高级建模平台相同,您可选择交叉验证技术。
可靠性框图
用户会经常遇到这种需求:要分析一个较复杂分析系统(例如拥有多个硬盘的RAID存储阵列,或者配备四个引擎的飞机)的
可靠性。JMP为用户提供很多用于分析上述系统中单独部分的可靠性的工具。而借助JMP Pro,可以利用单一部件的可靠性,构建一个多部件的复杂系统并分析整个系统的可靠性。通过“
可靠性框图”,可以轻松设计并弥补系统弱点,获得更详实的系统信息,从而避免系统在将来发生故障。
借助此平台,可通过查看不同设计和比较多个系统的设计图,轻松执行假设分析。还可以确定最佳位置来添加冗余,并降低系统故障的可能性。
可修复系统模拟
某些系统或复杂系统的部件离线时间过长会造成巨大损失。要保持这些系统的完整性,用户需要合理计划系统部件的修复或通过在系统不可用期间完成额外修复,最大化出现意外停机时能够实现的收益。借助JMP Pro,可使用“可修复系统模拟”确定系统不可用的时长,并回答以下关键问题:在指定时间内将发生的修复事件数和每一修复事件的成本。
覆盖矩阵
覆盖矩阵用于检测因子交互作用可能导致故障且每次实验运行的成本十分高昂的应用。因此,需要设计一个试验,在降低成本并缩短时间的同时,最大概率找到缺陷所在,实现利润最大化。覆盖矩阵可以帮助用户实现上述目标。可以使用JMP Pro进行实验设计,对
确定性系统进行检测,并按照特定交互作用顺序覆盖所有可能的因子组合。
当出现不合理的因子组合时,可以使用交互式的“无效组合”过滤器,将这些因子设置组合从设计中自动排除。
运用JMP Pro进行覆盖阵列设计的一个显著优势在于,JMP Pro不仅仅覆盖阵列设计的工具,他更是一个强大的统计分析工具。可以在JMP Pro中进行各种统计分析。举例来说,还没有任何的覆盖数组设计的软件能像JMP Pro一样可以使用广义回归进行数据分析。这是JMP Pro相比其他覆盖数组设计工具的巨大优势。
严格地说,JMP Pro不仅仅是设计工具;它还可以导入任何软件生成的覆盖阵列设计,对其进一步优化并分析结果。用户可以自行设计阵列,不必依靠他人为用户构建实验。JMP Pro的覆盖阵列,让测试变得更加智能。
混合模型
混合模型在分析中包含
固定效应和
随机效应。用户可以利用这些模型分析同时涉及时间和空间的数据。例如,在进行药物试验时,往往存在多个受试者进行多次测量的情况,这时可以使用混合模型进行效应的估计。另外在制药、生产或者化工行业经常会用到的交叉设计也适用于该情况。
JMP Pro提供混合模型的拟合,可以指定模型中的固定效应,随机效应以及重复效应;指定测试的多个变量间的关联效应,设定对象和连续性效应;以上所有操作均可在直观的界面中拖放完成。
另外,对于多种情况下的数据相关您可以估计相应地协方差参数。比如我们对受试对象进行测量时,如果受试对象可以分为不同的群体(比如来自同一个家庭),则来自同一个群体的受试对象的数据存在相关性;又譬如对同一个受试对象进行多次测量时,则该受试对象的多次观察数据之间可能存在相关性或者存在不同的变异。
如果存在空间上的相关性,则用JMP Pro构建混合模型时,可以很简单的通过可视化的方式来决定您的数据到底适合什么样的空间协方差结构。
提升模型
企业也许只想给那些对营销活动做出积极响应的个人发送产品和服务信息,以便在有限的市场营销预算下获取最大的收益。然而,这项任务可能看起来很艰巨,尤其当企业面临大量数据集以及包含众多消费者行为和背景信息相关变量时更是如此。提升模型具有以下作用。提升模型又称为增量建模、真提升建模或网络建模,用于帮助优化
市场营销决策、确定个性化医学协议,或者在更广泛的方面来说,可用于识别可能对某项活动作出回应的个人特征。
企业可借助JMP Pro中的提升模型进行这些预测。JMP Pro对那些发现拆分的分割模型进行拟合,以实现处理差异的最大化。从而帮助您识别可能对某项活动作出积极回应的特定人群;进而制定有效的针对性决策,合理规划资源,给此特定消费群体带来最强的冲击。
高级计算统计
JMP Pro中的列联表分析提供了精确统计检验,单因子
方差分析平台则提供了精确非参数统计检验。此外,JMP Pro还包含可用于大多数JMP报表的Bootstrapping统计的一般方法。
Bootstrapping模拟了统计量的近似分布。JMP Pro是一款无需编写任何代码,即可对统计量进行自助抽样的
统计软件包。一键式bootstrapping意味着,只需点击一下即可对JMP报告中的任何统计量进行自助抽样。
当用户面对的数据不符合教科书中对分布的假设,或者某些统计方法根本不存在分布假设,进而无法估计统计量的分布参数时,BootStrap方法就可以派上用场了。比如,可用该方法对
非线性模型中用来预测的系数进行bootstrapping的估计或者对分位数进行
置信区间估计。还可以用Bootstrapping估计预测模型的不确定性。Bootstrapping让用户可以在具有较少假设的估计中评估置信度 – JMP Pro中的一键式Bootstrapping使这项工作变得十分轻松。
分享和交流结果
JMP始终以发现为研究重点,坚持不懈地寻找在组织范围内传达这些发现成果的最佳方法。JMP Pro涵盖了JMP的所有可视化和交互式功能,能为用户提供前所未有的数据研究方式。通过动态链接的数据、图形和统计数据,JMP Pro能够在三维图形或动画中呈现实时调查结果,显示动态变化信息,从而产生极具价值的新见解,说明如何建模并详细介绍流程。
其他功能
· 模型比较条件,用于比较多个拟合预测的拟合性
· 采用训练、验证和测试方法的模型验证
·Bootstrap 森林,一种随机森林技术
· 梯度提升决策树
· 具有多达三种激活函数的多层神经网络
· 具有早期停止规则的梯度提升神经网络
· 交叉验证逐步回归
· 对JMP 报告中多数统计量的一键式Bootstrapping
· 采用多向列联表的精确关联性测试
· 针对非参数单因子方差分析的精确测试